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fi 要 : 准确 高 效 地 监测 动物 信息 ， 及 时 分 析 动 物 的 生理 与 身体 健康 状况 ， 并 结合 智能 化 技术 进行 自动 饲 喂 和 养 


殖 管理 ， 


对 于 家 冀 规 模 化 养殖 意义 重大 。 深 度 学 习 技术 
杂 的 畜牧 养殖 环境 中 动物 信息 监测 。 为 进一步 分 析 人 工 智 能 技术 在 当下 智慧 畜牧 业 中 研究 应 


于 具有 自动 特征 提取 和 强大 图 像 表 示 能 力 ， 更 适用 于 复 


J, ASCE =e 


和 猪 三 种 家 畜 ， 介 绍 了 深度 学 习 技 术 在 目标 检测 识别 、 体 况 评 价 与 体重 估计 以 及 行为 识别 与 量化 分 析 的 研究 现状 。 


其 中 ， 目 标 检测 识别 有 利于 构建 动物 个 体 电子 档案 ,在 此 
康 情况 等 ， 这 也 是 智慧 畜牧 业 发 展 的 趋势 。 智 慧 畜牧 养殖 技术 当前 面临 着 应 用 场景 存在 多 视角 、 多 尺度 、 多 场景 
和 少 样本 等 挑战 以 及 智能 技术 泛 化 应 用 的 间 题 ， 本 文 结合 畜牧 业 实际 伺 养 和 管理 需求 ， 对 智慧 畜牧 业 发 展 进行 展 
望 并 提出 了 ; 结合 半 监 督 或 者 少 样本 学 习 来 提高 深度 学 习 模型 的 泛 化 能 力 ， 人 、 


基础 上 可 以 关联 动物 的 体 况 体重 信息 、 行 为 信息 以 及 健 


装备 和 养殖 动物 这 三 者 的 统一 协 


作 及 和 谐 发 展 ; 大 数据 、 深 度 学 习 技 术 与 畜牧 养殖 的 深度 融合 等 发 展 建议 ， 以 大 
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进一步 推动 畜牧 养殖 智能 化 发 展 。 
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15| 言 


畜产 品 是 人 类 重要 食物 来 源 ， 页 献 了 25% 以 上 
的 膳食 蛋白 ， 研 究 畜 产品 对 食品 安全 具有 重要 意 
义 。 随 着 人 口 总 数 增长 和 农业 劳动 力 的 下 降 ， 如 何 
在 有 限 的 土地 和 资源 下 ， 通 过 机 械 化 、 智 能 化 来 提 
高 动物 产 出 效率 ， 增 加 肉 、 奶 产品 供应 数量 和 提高 
产品 质量 ， 已 成 为 未 来 智慧 畜牧 业 发 展 的 重要 方 
向 “"。 在 智慧 畜牧 业 中 ， 常 利用 接触 式 (温度 、 加 
速度 ) 传 感 顺 、 非 接触 式 计 算 机 视觉 传感器 或 两 者 
相 结合 的 技术 来 获取 动物 信息 ， 随 后 用 机 器 学 习 等 
方法 构建 模型 ， 最 终 实 现 畜 类 目标 检测 、 体 况 评 
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价 、 行 为 识别 等 ”。 

其 中 ， 计 算 机 视觉 技术 由 于 具有 客观 、 无 创 等 
优点 被 广泛 应 用 于 畜牧 监测 中 中。 早期 的 计算 机 视 
觉 技术 主要 从 图 像 或 视频 中 提取 人 工 设 计 的 特征 
(颜色 、 形 状 、 纹 理 等 ) 并 结合 机 器 学 习 算 法 实现 
识别 或 检测 ， 但 整体 的 精度 很 大 程度 依赖 于 特征 提 
取 方 法 ， 且 复杂 的 场景 、 牲 冀 间 的 遮挡 以 及 光照 等 
都 会 影响 特征 的 提取 ， 从 而 影响 识别 效果 。 近 年 
来 ， 深 度 学 习 的 发 展 不 仅 突破 了 视觉 特征 表征 困难 
的 问题 ， 提 高 了 对 图 像 和 视频 的 认 知 水 平 ， 也 加 速 
了 计算 机 视觉 技术 在 畜牧 业 的 技术 进步 EH, 
获取 动物 目标 视觉 特征 的 神经 网 络 有 : 卷 积 神经 网 
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2% (Convolutional Neural Network, CNN) 5 、 基 于 
区 域 的 卷 积 神经 网 络 (Region-CNN, R-CNN) 5, 
YOLO (You Only Look Once) 系列 “5 等。 动物 视 
频 信息 中 往往 包含 时 间 信 息 ， 故 需要 提取 时 间 信 
息 ， 和 常用 的 深度 学 习 网 络 获取 时 序 信息 的 模型 有 循 
环 神经 网 络 (Recurrent Neural Network, RNN) ?', 
长 短 时 记忆 网 络 (Long Short-Term Memory, 
LSTM) "以 及 衍生 算法 等。 此 外 可 将 两 者 相 
结合 来 获取 时 空 特征 来 提高 动物 目标 检测 和 行为 识 
别 的 准确 率 。 在 当前 智慧 畜牧 研究 中 ， 深 度 学 习 方 


法 已 被 用 于 动物 信息 监测 ， 并 作为 决策 文 持 工具 。 
深度 学 习 在 智 意 畜 牧 中 应 用 如 图 1 所 示 ， 首 先 利 用 
传感器 获取 能 够 反映 性 畜 福 利和 健康 的 原始 数据 。 
其 次 利用 深度 学 习 技 术 提 取 原 始 数 据 中 的 特征 并 构 
建 信息 感知 模型 ， 将 模型 应 用 于 牲畜 养殖 中 得 到 模 
型 对 应 的 统计 信息 (如 行为 识别 统计 信息 、 个 体 识 
别 统 计 信息 等 )。 最 后 ， 利 用 深度 学 习 算 法 得 到 统 
计 信 息 反馈 到 畜牧 养殖 场 的 管理 、 决 策 和 调控 (如 
生产 指标 、 环 境 调 控 、 精 准 喂 养 、 疾 病 防 控 等 )。 


T 深度 网 ? 
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应 用 
体 况 评价 
e - : 
1e => 行为 识别 
© ‘ 
e 个 体 识别 


各 种 传感器 信号 接收 与 传递 


提取 特征 训练 并 构建 信息 感知 
网 络 模型 


Al 深度 学 习 在 家 畜 智 慧 养殖 中 的 应 用 


Fig. 1 Application of deep learning in smart animal farming 


虽然 深度 学 习 技 术 相 对 于 传统 的 计算 机 视觉 技 
术 在 复杂 场景 下 能 够 取得 更 好 的 效果 ， 但 构建 智能 
化 牲畜 养殖 仍 需 要 结合 实际 情况 进一步 探索 研究 。 
针对 牲畜 生理 生态 信息 获取 、 生 长 发 育 、 繁 殖 等 生 
理 调 控 、 健 康 诊断 及 品种 选 育 等 现代 养殖 产业 发 展 
需求 ， 本 文 以 牛 、 猪 、 羊 等 主要 家 畜 为 研究 对 象 ， 
介绍 并 分 析 了 深度 学 习 技 术 在 动物 目标 检测 识别 、 
体 况 评价 与 体重 估计， 以 及 行为 识别 与 量化 分 析 的 
研究 现状 和 面临 的 挑 成 ， 并 对 现代 化 畜牧 业 的 发 展 
方向 进行 了 展望 ， 为 现代 畜牧 业 智能 化 、 精 准 化 管 
理 生 产 建设 提供 参考 。 


2 动物 目标 检测 识别 


动物 目标 检测 识别 已 成 为 畜牧 业 的 组 成 部 分 ， 
是 实现 现代 精细 化 科学 畜牧 业 的 必由之路 。 在 智慧 


畜牧 中 ， 可 做 到 及 时 检测 动物 目标 ， 确 定 动物 个 体 
身份 并 获取 相关 信息 ， 建 立 动物 个 体 档 案 ， 为 数字 
化 管理 和 畜牧 产品 溯源 提供 信息 支撑 。 

目前 通常 通过 给 动物 赋予 一 个 独特 的 标识 符 或 
标志 来 检测 识别 动物 个 体 “”。 其 中 ， 最 常见 的 方 
法 是 采用 塑料 耳 标 或 射频 识别 设备 来 标识 动物 个 
体 ， 但 该 方法 存在 设备 损坏 或 丢失 以 及 碰撞 等 外 界 
的 干扰 问题 。 近 年 来 ， 随 着 信息 技术 的 发 展 ， 基 于 
计算 机 视觉 技术 的 目标 检测 识别 方法 由 于 具有 非 接 
触 性 和 实用 性 等 优点 而 被 广泛 应 用 于 牲畜 识别 研究 
中 ,通常 基 于 目标 样本 的 视觉 特征 (如 形状 、 纹 
理 、 颜 色 等 )， 结合 智能 算法 实现 目标 检测 识 
别 “ 忠 。 动 物 个 体检 测 识别 的 常用 样本 图 像 包 括 口 
B TT qup t. Sep o7 EKR, FF AE TP DCN 
特征 信息 来 实现 个 体检 测 识别 (图 2)。 
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Xue 等 ' 引 提出 了 一 种 基于 欧式 空间 度量 的 绵羊 脸 
部 检测 识别 方法 (SheepFaceNet) ， 利 用 自然 环境 
下 的 羊 脸 图 像样 本 对 网 络 进行 训练 ， 以 实现 非 接触 
式 绵羊 身份 识别 。 此 外 ， 其 针对 羊 脸 图 像 中 无 效 信 
息 多 、 羊 脸 姿 势 和 角度 差 的 问题 ， 提 出 羊 脸 检 测 与 
校正 (SheepFaceRepair) 方法 ， 使 绵羊 面部 区 域 对 
齐 ， 最 后 利用 SheepFaceNet 实 现 羊 脸 的 识别 。 

等 4) 将 Mobilenetv2 与 Vision Transformer 结 合 ， 提 
` 出 了 一 种 名 为 MobileViTFace 的 羊 脸 检测 识别 模型 。 
A 该 模型 增强 了 模型 提取 细 粒 度 特征 的 能 力 ， 并 通过 


(b) 脸 部 区 域 


Transformer 抑制 背景 信息 的 干扰 ， 从 而 更 有 效 地 区 


^. 
分 不 同 的 羊 脸 。Kumar 等 = 开发 了 一 种 基于 奶牛 
口 鼻 图 像样 本 的 个 体 识别 深度 学 习 网 络 模型 ， 采 用 
CNN 和 深度 信念 网 络 (Deep Belief Nets, DBN) 
提取 一 组 纹理 特征 并 表示 和 牛 的 口 描 图 像 ， 通 过 堆 释 
(c) u SE EC (d)JE-T- EC 45 Ew " - 
图 2 Sed A ER OR [AER H amt SFR AR (Stacked Denoising Auto En- 


coder, SDAE) 对 提取 的 图 像 特征 进行 编码 ， 优 于 
基于 口 段 图 像 数 据 库 识别 牛 的 最 先进 方法 。 


2.2 整体 及 关键 区 域 检测 识别 


Fig. 2 Common target detection area for livestock 
2.1 脸 部 检测 识别 
基于 深度 学 习 的 非 接触 式 动物 检测 识别 能 够 有 


效 减 轻 畜 牧场 压力 并 推动 精细 化 科学 养殖 业 的 发 在 智慧 畜牧 领域 中 ， 进 一 步 对 动物 整体 以 及 关 
展 。 近 期 研究 人 员 利 用 深度 学 习 算 法 实现 了 猪 、 EA inr 
羊 、 牛 等 动物 脸 部 的 无 接触 高 效 检测 识别 。 息 ， 比 如 腿 部 与 报 干 间 的 位 置 关系 ， 腿 部 间 的 相对 


25 fi 3E ilm CU 利用 相似 度 较 高 的 猪 脸 匹 ”关系 等 ， 可 以 反映 出 动物 健康 信息 ， 而 基于 深度 学 

配 数 据 集 训练 形变 卷 积 神经 网 络 (Deformable Con- 习 在 这 一 方面 的 信 ， — at — 步 探索 。 

volution Networks，DCN)， 得 到 形变 后 的 猪 脸 数据 Qiao ^F ^ 提出 | 的 肉牛 个 体 识 
集 ， 并 使 用 形变 猪 脸 数据 集 对 脸 部 特征 点 检测 神经 ” 别 的 深度 学 习 模型 。 通 过 CNN 网 络 从 图 像 序列 中 
网 络 模型 (Tweaked Convolutional Neural Network, 提取 视觉 特征 ， 然 后 将 这 些 提取 的 特征 用 于 训练 
TCNN) 进行 微调 ， 得 到 猪 脸 特征 点 检测 模型 用 ”LSTM 以 捕获 时 空 信息 并 识别 牛 只 个 体 ， 在 15 帧 和 
该 方法 进行 猪 脸 特征 点 检测 ， 错 误 率 仅 为 5.60%。 ”20 帧 视频 长 度 上 分 别 达到 了 88% 和 91% 的 准确 率 。 
fij WS JE 5 "在 YOLOv3 模 型 引入 密 连 块 和 SPP ” 何 东 健 等 ”提出 了 一 种 改进 的 YOLOv3 模 型 用 于 
(Spatial Pyramid Pooling) 模块 ， 提 出 YOLOv3DB- ”奶牛 个 体 识别 ， 在 奶牛 背部 图 像 数 据 集 中 改进 的 
SPP (YOLOv3-DenseBlock-SPP) 模型 来 检测 识别 。 YOLOv3 模 型 的 奶牛 个 体 识别 准确 率 为 95.91%, Æ 
A, SHUT 90.18% 的 平均 精度 ， 并 且 当 感 兴 均 帧 率 为 32 Vs， 可 快速 识别 奶牛 个 体 。Hu 等 加 
区 域 阔 值 为 0.5、 分 类 概率 阔 值 为 0.1 时 ， 模 型 的 平 RH YOLO 模型 从 原始 图 像 中 检测 并 分 制 出 奶牛 区 
均 精 度 均 值 比 YOLOv3 模型 高 9.87%。 魏 斌 等 域 , 并 将 检测 到 的 奶牛 对 象 分 割 成 三 个 部 分 ， 即 头 
将 YOLOv3 算 法 检测 到 的 羊 脸 作为 个 体 识别 的 数 部、 躯干 和 腿 部 ， 通 过 训练 三 个 独立 的 CNN 网 络 
据 ， 利 用 VGGFace 模 型 训练 后 取得 了 64% 左 右 的 。” 从 这 三 个 部 分 中 提取 深层 特征 ， 并 设计 了 特征 融合 
识别 准确 率 ; 选取 正面 羊 脸 作为 输入 数据 训练 VG- ”模型 获取 最 终 特征 ， 最 后 通过 支持 向 量 机 (Sup- 
GFace 模型 时 ， 得 到 了 91% 以 上 的 识别 准确 率 。 port Vector Machines, SVM) 分 类 器 来 识别 每 一 头 
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奶牛 ， 实 现 了 98.36% 的 奶牛 识别 准确 率 。Jiang 
等 2 提出 了 一 种 FLYOLOv3 (FilterLayer YO- 
LOv3) 深度 学 习 框 架 ， 实现 了 复杂 场景 下 奶牛 个 
体 关 键 区 域 的 检测 〈 如 躯干 、 腿 和 头 部 ) ， 并 在 和 白 
天 和 夜间 数据 集 上 进行 了 验证 ， 均 取得 了 较 好 的 检 
测 结 


2.3 无 人 机 图 像 目 标 检测 


放牧 养殖 的 畜牧 场地 由 于 活动 范围 较 大 ， 往 往 
使 用 无 人 机 (Unmanned Aerial Vehicle, UAV) {hi 
拍 并 监测 牲畜 活动 信息 所。 而 基于 UAV 的 动物 监 
M, RIA HAY UAV 硬件 处 理 速 度 得 到 很 大 的 改善 ， 
但 算法 性 能 仍 会 影响 基于 UAV 实时 检测 的 效果 ， 
而 深度 学 习 可 以 满足 这 一 需求 。Andrew 等 "首先 
在 无 人 机 航拍 视频 数据 基础 上 ， 通 过 区 域 卷 积 神经 
网 络 R-CNN 和 核 相 关 滤 波 算法 (Kernel Correlation 
Filter, KCF) 实现 荷 斯 坦 奶 牛 的 个 体检 测 和 跟踪 ， 
再 通过 Inception V3-LSTM 网 络 结构 实现 奶牛 的 个 
体 识 别 ， 最 终 识别 准确 率 为 98.1%。Shao 等 Fil 
Barbedo 5f ^" 通过 CNN 网 络 模型 在 UAV 网 像 上 实 
现 了 奶牛 的 目标 检测 和 个 数 统计 。 

以 上 研究 表明 ， 深 度 学 习 技 术 应 用 于 UAV 图 
像 的 目标 检测 识别 是 可 行 的 ， 且 将 深度 学 习 技 术 应 
用 于 其 他 硬件 设备 (机 器 人 、 地 面 车 辆 等 ) 构建 智 
能 化 监测 系统 也 是 未 来 发 展 的 主要 趋势 之 一 ”。 


2.4 小 结 


& 管 深度 学 习 技术 已 经 在 动物 检测 识别 领域 取 
得 进展 ， 但 仍 存在 一 些 问 题 ， 比 如 缺乏 基准 数据 集 
和 评估 标准 。 由 于 人 研究 使 用 的 数据 集 、 预 处 理 技 
术 、 指 标 和 模型 不 同 ， 因 此 对 现 有 方法 进行 比较 得 
到 的 结果 并 不 完全 合理 ”。 具 体 来 说 ， 目 标 检测 
的 结果 好 坏 与 样本 有 直接 关系 ， 对 于 样本 中 只 包含 
单个 个 体 或 目标 相对 比较 突出 时 ， 目 标 检测 以 及 个 
体 识别 准确 率 高 ， 但 目标 区 域 检测 和 特征 提取 方法 
的 选择 也 会 直接 影响 最 终 的 检测 结果 ， 且 外 界 环境 
(光照 强度 、 遮 挡 等 ) 以 及 拍摄 角度 和 图 像 质量 都 
会 影响 检测 结果 。 故 通过 多 角度 构建 样本 集 来 实现 
目标 检测 与 个 体 识别 仍 需 要 进一步 探索 。 例 如 基于 
脸 部 的 个 体 识别 研究 ， 大 多 数 数据 集 是 脸 正 面 拍摄 


的 图 像 ， 然 而 头 部 也 会 呈现 多 角度 的 情况 ， 且 实际 
需求 中 更 希望 在 现场 或 远程 监控 视频 时 ， 随 机 抓 取 
一 幅 图 像 即 可 检测 并 识别 牛 只 个 体 ， 以 及 个 体 其 他 
的 相关 信息 。 因 此 ， 需 要 构建 更 为 复杂 的 样本 集 
(EAE, BER) 等 来 模拟 实际 饲养 中 的 场景 ， 构 
建 可 应 用 于 不 同 场景 的 智能 算法 ， 并 进一步 开发 高 
效 精准 及 方便 操作 的 检测 与 识别 系统 。 


3 动物 体 况 评价 与 体重 估计 


动物 表 型 信息 包含 了 尾 头 轮廓 曲率 、 体 长 和 体 
表面 积 等 ， 其 中 尾 头 轮廓 曲率 主要 用 于 的 动物 体 况 
评分 ， 体 长 和 体 表 信 息 主 要 应 用 于 动物 的 体重 佑 
计 “ 站 。 目 前 的 研究 首先 提取 动物 体 尺 参 数 特征 ， 
通过 构建 基于 机 器 视觉 或 深度 学 习 等 相关 模型 来 获 
取 动 物 表 型 信息 以 评价 动物 体 况 和 体重 估计 。 

3.1 体 况 评价 

身体 状况 评分 (Body Condition Score, BCS) 
是 动物 福利 重要 指标 之 一 ， 可 以 反映 动物 的 饮食 情 
况 、 胖 瘦 、 生 产 力 以 及 健康 和 福利 “”。 以 奶牛 为 
例 (图 3)，BCS 的 重点 区 域 包 括 背 部 、 尾 根 、 辟 
RB. WA AEB. BCS 系统 通常 使 用 5 点 量 
R (1 代表 瘦弱 的 牛 ，5 代表 肥 胖 的 咎 ) 表达 评估 
结果 。 传 统 上 ，BCS 通常 由 经 验 丰 富 的 农民 使 用 触 
觉 或 视觉 方法 获得 人 。 然而， 人 工 方法 主观 性 
强 ， 且 易 受 到 外 部 环境 的 影响 。 因 此 ， 迫 切 需 要 客 
观 、 准 确 和 稳健 的 BCS 测量 方法 。 在 现代 畜牧 业 
中 ， 通 常 采用 计算 机 视觉 技术 获取 动物 的 体 表 信 
息 ， 再 通过 机 器 学 习 等 算法 构建 评估 模型 实现 BCS 
评估 m. 

基于 计算 机 视觉 技术 的 体 况 评价 主要 使 用 后 视 
图 或 顶 视 图 来 获取 动物 背部 区 域 相应 的 身体 参数 来 
进行 体 况 评估 “” 。 为 满足 精准 畜牧 的 需求 ， 迫 切 
需要 构建 和 设计 操作 简单 、 快 速 上 且 用 户 友好 的 牛 只 
体 况 监测 系统 ， 近 年 来 深度 学 习 被 应 用 于 动物 体 况 
评价 研究 中 。 

孔 商 羽 和 陈 春雨 “* 采用 Mask R-CNN 分 割 猪 
只 图 像 ， 并 结合 ResNet101-FPN 提取 猪 只 特征 ， 通 
过 多 任务 学 习 回 归 网 络 来 预测 猪 只 体重 和 体 况 评 
分 。 体 重 预 测 准确 率 提高 了 5%， 体 况 评 分 预测 准 
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注 : 1. 背部 ; 2. BAR; 3. AER; 4. BEB; 5. 肋骨 ; 6. 胸部 
图 3 用 于 确定 牛 BCS 的 区 域 
Fig. 3 Areas used for visually determining body condition 


score in cattle 


确 率 提高 了 3%。Cevik ll Mustafa ^" 38 iE R-CNN 
网 络 模型 对 奶牛 原始 图 像 中 标记 的 BSC 区 域 进 行 识 
别提 取 ， 最 终 正确 分 类 准确 率 为 67.39%。Li 等 和 
采用 YOLOv2 模 型 检测 并 识别 出 可 以 代表 奶牛 肥胖 
程度 的 牛尾 巴 周围 区 域 ， 并 将 该 区 域 输入 到 
ResNet50 分 类 器 中 实现 牛 身体 状况 评分 估计 ， 在 
BCS 估计 值 与 真实 值 相差 0.0 点 单位 内 准确 率 为 
64.55%， 而 在 相差 0.5 个 单位 内 准确 率 达 到 了 
94.5% 的 奶牛 身体 状况 评分 估计 精度 。Huang 等 '” 
采用 单 步 多 框 检测 吉 (Single Shot MultiBox Detec- 
tor, SSD) 方法 来 检测 尾部 并 评估 BCS， 在 奶牛 图 
像 上 可 以 达到 98.46% 的 分 类 准确 率 和 89.63% 的 定 
位 准确 率 。Alvarez 等 ^" 采用 Kinect v2 获取 奶牛 在 
通道 行走 的 俯视 图 ， 并 提取 奶牛 的 深度 信息 以 及 边 
缘 信 息 等 ， 分 别 通过 SqueezeNet 模 型 和 CNN 网 络 
来 估计 BCS。 实 验 结果 表明 ，BCS 估计 值 与 真实 值 
相差 0.25 个 单位 内 的 总 体 准 确 率 达到 了 82% ， 而 相 
差 0.50 个 单位 以 内 的 总 体 准确 度 高 达 97%。 上 述 中 
虽然 取得 了 些许 成 果 ， 但 样本 图 像 获 取 角 度 比较 单 
一 且 视 场 中 往往 只 有 一 头 动 物 ， 而 在 实际 饲养 环境 
以 及 不 同 饲养 环境 下 ， 能 否 安 装 采 集 设备 是 实际 问 
题 ， 因 此 迫切 需要 灵活 的 图 像 获取 装备 或 系统 以 应 
用 于 实际 场所 。 

综 上 所 述 ， 体 况 评 价 研究 中 数据 采集 通常 基于 
2D 或 3D 视 觉 采 集 设 备 ， 且 其 相关 技术 的 体 况 评分 
工作 取得 了 重大 进展 。 但 应 该 指出 的 是 ， 尽 管 在 畜 
牧 业 中 ， 研 究 者 对 3D 技 术 的 兴趣 越 来 越 大 ,但 3D 
传感器 比 2D 工具 更 昂贵 ，3D 数 据 处 理 和 相关 算法 
也 更 复杂 。 因 此 ， 在 自动 BCS 评 估 中 ，3D 传感器 


可 能 不 会 完全 取代 2D 工具。 另外 ， 为 完善 一 个 完 
整 的 5 点 尺度 BCS 系统 ， 也 需要 一 个 样本 分 布 均匀 
的 数据 集 以 帮助 系统 更 快 地 收敛 并 更 好 地 泛 化 。 其 
次 ， 也 需要 更 客观 、 可 实际 度量 的 BCS 真实 标准 ， 
以 消除 人 为 评分 过 程 中 的 主观 错误 。 此 外 ， 在 实际 
饲养 环境 下 ， 动 物 存在 多 姿态 、 多 尺度 ， 甚 至 遮挡 
的 情况 ， 从 而 影响 目标 区 域 特征 的 提取 ， 故 深度 学 
习 在 实际 饲养 环境 下 ， 实 现实 时 的 体 况 评分 仍 需 要 
进一步 探索 。 


3.2 体重 估计 


动物 体重 在 优化 生长 性 能 、 增 加 农民 收入 和 监 
测 动 物 福利 方面 发 挥 着 重要 作用 。 体 重 会 影响 动物 
泌乳 、 和 生长、 怀孕 和 生育 能 力 等 “”， 因 此 ， 动 物 
养殖 户 需 要 一 种 自动 、 准 确 、 非 侵入 性 的 称 重 方 
法 。 目 前 ， 体 重 估计 方法 可 分 为 直接 法 和 间接 法 。 
通过 电子 或 机 械 秤 来 单独 称 重 的 直接 体重 估计 方法 
虽然 可 以 实现 最 准确 的 称 重 ， 但 存在 耗 时 且 可 能 对 
动物 造成 伤害 和 压力 的 现象 ， 无 法 便捷 使 用 。 间 接 
体重 估计 是 通过 2D 或 3D 设 备 (RGB 、 热 红外 、 激 
光 (Light Detection and Ranging, LiDAR) fil TOF 
(Time of Flight) 等 ) 获取 动物 表 型 数据 信息 ， 然 
后 基于 数据 分 析 构 建 身体 参数 与 体重 的 关系 UU, 
如 图 4 所 示 。 通 常 思路 是 ， 首 先 提取 体 长 、 体 宽 和 
面积 等 形态 特征 ， 然 后 基于 图 像 分 析 和 机 需 学 习 ， 
构建 特征 和 权重 之 间 的 模型 以 用 于 估计 体重 。 

基于 深度 学 习 技 术 在 体重 估计 研究 中 得 到 了 应 
用 。Pezzuolo % °°! 分 别 使 用 深度 相机 和 手动 测量 
获取 猪 的 胸围 、 长 度 、 高 度 等 特征 数据 ， 并 利用 线 
性 回归 模型 和 非 线性 回归 模型 验证 基于 深度 相机 测 
量 出 的 数据 在 体重 估计 方面 的 有 效 性 ， 其 误差 比 手 
动 测量 的 模型 低 10%。 张 建 龙 等 ”对 比分 析 了 
Xception 、 MobileNetV2 , DenseNet201 和 
ResNet152V2 4 种 模型 对 育肥 猪 体重 佑 测 效 果 ， 发 
现 深 度 卷 积 网 络 可 用 于 猪 体重 的 快速 估计 。Zhang 
等 5" 通过 Intel Realsense D435 深度 相机 获取 猪 的 
身高 ， 并 实际 测量 体型 数据 包括 体 长 (BL)、 肩 宽 
(SW), A (SH), oe (HW) WEE (HH), 
提出 一 种 使 用 基于 Xception 的 多 输出 回归 CNN 模 
型 ， 实 现 了 猪 体重 和 体型 估计 。Ruchay 5$ ^" 获取 
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(a)RGB 图 像 


(c) TR E 
图 4 基于 2D 或 3D 设 备 的 家 畜 信 息 获 取 展 示 


(d)3D 图 像 


Fig. 4 Acquisition and display of livestock information using 
2D or 3D equipment 

4 IW) RGB-D 侧 视图 像 ， 通 过 双边 滤波 进行 图 像 预 
处 理 并 归 一 化 ,构建 CNN 网 络 训练 并 测试 样本 数 
据 来 实现 牛 的 体重 预测 ， 其 平均 绝对 误差 为 9.1%。 
Gjergji 4" 49r T CNN 网 络 、RNN 网 络 、RA 模 
型 和 RA-CNN 网 络 在 奶牛 体重 预测 应 用 方面 的 性 
能 ， 结 果 表 明 CNN 网 络 性 能 最 高 ， 其 平均 误差 为 
23.19 kg。Dohmen 等 “使 用 Mask-RCNN 分 割 算法 
从 场景 中 提取 分 割 出 牛 的 区 域 ， 并 通过 CNN 网 络 
来 预测 牛 的 体重 ， 其 中 基于 侧 视图 模型 的 尼 为 
0.91, SOW HR 1 22 N 27 kg, MAN E PEW ROW 
0.96， 均 方 根 误差 为 20 kgo 

深度 学 习 技 术 在 智慧 畜牧 养殖 业 中 的 体重 估计 
应 用 不 太 广 泛 ， 仍 需 探 索 低 成 本 、 灵 活 、 高 精度 的 
动物 体重 估计 方法 或 系统 。 虽 然 基于 2D 或 3D 设 备 
的 方法 构成 了 一 种 非 侵入 式 的 体 量 估计 系统 ， 但 对 
活体 动物 的 非 接触 式 研 究 仍 受 到 动物 姿态 变化 、 拍 
摄 角度 和 光线 条 件 等 诸多 因素 的 限制 。 用 于 农场 环 
境 的 实用 性 体重 估计 系统 需要 适应 各 种 挑战 ， 包 括 
不 同 的 照明 条 件 和 动物 运动 姿态 等 ， 以 便 能 够 可 靠 
地 提取 体重 有 关 的 特征 ， 实 现 体重 的 精确 估计 。 


3.3 小 结 


将 深度 学 习 技 术 应 用 于 动物 的 体 况 评 价 与 体重 
估计 中 仍 有 挑战 。 由 于 牛 场 中 往往 有 行走 的 通道 ， 


故 可 探索 在 行走 通道 中 获取 牛 脸 图 像 或 背部 图 像 来 
实现 牛 的 个 体检 测 和 识别 ， 以 及 体 况 评价 和 体重 估 
计 ， 将 两 者 相关 联 ， 可 实现 并 构建 牛 只 ID 与 体 况 
体重 相关 联 的 监测 系统 。 此 外 ， 基 于 3D 数 据 的 深 
度 学 习 技术 在 猪 体重 方面 的 应 用 仍 有 很 大 的 提升 
空间 。 
4 动物 行为 识别 

动物 行为 可 反映 其 身体 健康 和 生理 情况 ， 是 畜 
牧 养殖 管理 的 重要 依据 。 目 前 常 通过 接触 式 和 
非 接触 式 两 种 方法 监测 动物 行为 。 接 触 式 监测 方法 
是 将 一 个 或 多 个 传感器 安装 在 动物 身上 来 完成 数据 
采集 ， 通 过 数据 分 析 与 建 模 来 实现 动物 行为 识 
别 ©) 5 而 非 接触 式 监测 方法 通常 基于 图 像 视频 等 
言 息 ， 提 取 相 关 特 征 并 构建 行为 识别 模型 中 。 深 
度 学 习 在 这 两 种 监测 方法 中 都 得 到 了 应 用 。 


4.1 接触 式 动 物 行为 识别 方法 


基于 电子 接触 式 传感器 和 深度 学 习 技 术 ， 可 以 
克服 传统 人 力 监 测 方法 的 次 端 ， 解 放 劳 动力 ， 提 高 
畜牧 养殖 业 的 智能 化 管理 。 当 前 常用 的 动物 行为 信 
息 采 集 的 传感器 主要 有 加 速度 传感器 和 声音 传 感 句 
AR. AH DER DLE SE eR. RFID (Radio Fre- 
quency Identification) 等 设备 安装 在 动物 身体 部 位 
(图 5) 上 获取 相关 行为 数据 ， 再 通过 深度 学 习 技 术 
进行 数据 分 析 ， 可 以 大 大 提高 动物 行为 识别 的 准确 
率 和 识别 效率 。 


(a) 颈 部 (b) 腿 部 (c) 耳 部 
AS 常见 牛 只 行为 检测 传感器 的 佩戴 位 置 


Fig. 5 Wear position of sensors for common cattle behavior 
detection 

Wang $E '9' 在 绵羊 颈 部 佩戴 麦克 风 并 采集 采 食 

声音 信号 ， 同 时 比较 了 深度 神经 网 络 (Deep Neu- 

ral Networks, DNN), CNN 和 RNN 网 络 在 采 食 行 

HRI EERE. ARRI, RNN, CNN 和 DNN 
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模型 的 准确 率 分 别 为 93.17%、92.53% 和 79.43%。 
应 烨 伟 等 “提出 一 种 基于 区 间 阔 值 与 遗传 算法 优 
化 支持 向 量 机 (Genetic Algorithm-Support Vector 
Machine, GA-SVM) 分 类 模型 的 母 羊 产 前 行为 识 
别 方法 。 该 方法 对 基于 颈 环 采集 节点 获得 的 加 速度 
数据 进行 小 波 降 噪 和 提取 轮廓 线 预 处 理 后 ， 利 用 区 
间 阅 值 分 类 法 和 GA-SVM 方 法 实现 母 羊 的 行为 识 
别 。 该 方法 实现 了 97.88% 的 行为 识别 准确 率 。 张 
Ap BE” 基于 羊 只 牧 食 的 三 轴 加 速度 数据 ， 利 用 
CNN 实 现 对 羊 只 采 食 、 咀 嚼 、 反 刍 3 种 牧 食 行为 的 
分 类 识别 ， 该 方法 对 羊 只 牧 食 行为 的 平均 识别 率 达 
到 了 93.8%。 郝 玉 胜 等 ” 基于 Wi-Fi 信 号 获取 奶牛 
的 运动 状态 数据 ， 通 过 数据 处 理 得 到 包含 奶牛 动作 
的 信道 状态 信息 (Channel State Information, CSI) 
序列 片段 ， 最 终 通过 LSTM 模型 构建 奶牛 行为 识别 
模型 ， 识 别 准确 率 为 96.67%。Peng 等 '” 采用 惯性 
测量 单元 获取 牛 的 行为 数据 ， 并 采用 具有 长 短期 记 
忆 的 循环 神经 网 络 (Long Short Term Memory-Re- 
current Neural Network, LSTM-RNN) 对 牛 的 八 种 
行为 进行 分 类 ， 分 类 准确 率 达到 了 80% 以 上 。Hos- 
seininoorbin 4 7" 通过 包含 三 轴 加 速度 计 的 传感器 
获取 肉牛 的 颈 部 运动 数据 ， 并 结合 深度 学 习 技 术 实 
现 肉 牛 多 种 行为 的 识别 ， 其 中 2 分 类 的 五 值 为 
94.9%，9 分 类 的 下 值 为 89.3%， 说 明 将 深度 学 习 技 
术 用 于 分 析 传 感 器 数据 是 可 行 有 效 的 。 

接触 式 获取 动物 行为 信息 的 方法 往往 需要 在 动 
物 身 上 安装 相应 的 传感器 ， 可 能 导致 动物 产生 应 激 
反应 ， 影 响 动物 健康 和 福利 。 此 外 ， 基 于 传感器 的 
行为 建 模 的 主要 挑战 之 一 是 ， 由 于 传感器 故障 和 动 
物 项 圈 的 物理 运动 导致 传感器 重新 定位 ， 从 而 造成 
数据 的 丢失 或 者 偏差 。 此 外 ， 牛 场 养 殖 场 中 ， 通 信 
信号 偏 弱 ， 传 感 器 获取 的 数据 是 否 可 以 实时 且 完 整 
地 上 传 到 云端 需要 实际 测试 ， 且 获取 传感器 数据 后 
也 面临 一 个 需求 问题 。 目 前 农场 主 不 仅仅 关注 动物 
行为 ， 而 且 更 加 关注 动物 健康 问题 ， 因 此 需要 对 数 
据 进一步 细 化 ， 以 达到 对 饲养 员 的 指导 作用 ， 但 这 
需要 大 量 的 数据 积累 。 


4.2 非 接 触 式 动物 行为 识别 方法 
目前 ， 非 接触 式 动物 行为 识别 方法 常 通过 计算 


机 视觉 系统 获取 目标 图 像 和 视频 等 信息 ， 再 通过 深 
度 学 习 模 式 实现 生物 视觉 特征 和 时 空 特征 提取 、 目 
标 检测 和 行为 识别 分 类 。 下 面 分 别 从 生物 视觉 特征 
和 时 空 特 征 的 角度 阐述 近年 研究 人 员 对 非 接触 式 动 
物 行为 识别 方法 的 研究 情况 。 

4.2.1 基于 生物 视觉 特征 的 行为 识别 研究 

基于 生物 视觉 特征 的 行为 识别 方法 通过 深度 学 
习 网 络 从 样本 视频 帧 或 图 像 中 检测 出 目标 区 域 并 获 
取 该 区 域 的 视觉 特征 ， 然 后 基于 此 特征 训练 并 构建 
行为 识别 网 络 模型 。 当 前 常用 的 模型 有 YOLOv3 和 
YOLOv4 等 。 

Kim 等 "" 3E Hj YOLOv3, YOLOv4 和 改进 YO- 
LOv3 对 猪 的 采 食 和 饮水 行为 进行 识别 分 类 ， 准 确 
率 普遍 大 于 90%， 但 猪 群 聚集 引起 重 琶 或 拥挤 会 导 
致 行为 检测 失败 是 一 个 研究 难点 。Jiang 等 ”通过 
YOLOv4 模 型 检测 出 山羊 目标 区 域 ， 并 获取 目标 区 
域 与 饮水 和 采 食 区 的 位 置 关 系 信 息 以 及 质心 的 时 间 
移动 量 ， 来 实现 采 食 、 饮 水 、 活 动 以 及 非 活动 行为 
的 识别 分 类 。 王 少 华 和 何 东 健 "通过 改进 YO- 
LOv3 模 型 ， 获 取 奶 牛 发 情 时 候 跨 行为 的 视觉 特征 ， 
并 训练 YOLOv3 网 络 实现 了 奶牛 的 发 情 行为 检测 ， 
准确 率 为 99.15%。Wu 等 ”提出 一 种 基于 YOLOv3 
模型 和 相对 步 长 特征 向 量 对 瘙 腿 奶 牛 和 非 踊 脚 奶牛 
进行 分 类 的 方法 ,该 方法 采用 YOLOv3 模 型 提取 奶 
牛 关键 区 域 (如 腿 部 ， 尖 部 ) 的 视觉 特征 并 训练 检 
测 网 络 模型 ， 在 检测 关键 区 域 的 基础 上 结合 奶牛 前 
后 腿 的 相对 步 长 构建 特征 向 量 ,将 其 输入 到 长 短期 
记忆 网 络 分 类 模型 中 判断 奶牛 是 否 跋 行 ， 识 别 准确 
率 达 98.57%。Ayadi 等 中 采用 CNN 模 型 提取 奶牛 
嘴 部 视觉 特征 ， 实 现 了 奶牛 反刍 行为 的 检测 和 识 
别 ， 其 识别 准确 率 为 95%。 

然而 ， 上 述 研究 中 只 关注 网 像 特征 ， 而 不 关注 
时 间 信 息 。 且 视频 帧 或 图 像 中 特征 提取 时 易 受 到 外 
界 环境 的 干扰 〈 如 光照 强度 、 背 景 颜色 、 建 筑 物 
等 )， 故 基于 生物 视觉 特征 的 行为 识别 模型 是 否 可 
应 用 于 不 同 场景 下 的 农场 检测 仍 需要 进一步 探索 。 
4.2.2 ”基于 时 空 特征 的 行为 识别 研究 

动物 行为 是 一 个 运动 的 连续 过 程 ， 除 了 空间 信 
息 外 还 包含 时 间 信息 ， 故 提取 动物 行为 的 时 序 特 征 
对 行为 识别 有 着 重要 意义 “*。 
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Chen “ 7" #2 +4  Xception 和 LSTM 相 结合 的 
行为 识别 模型 ， 通 过 Xception 提取 图 像 序列 的 空间 
特征 ， 并 输入 LSTM 中 进一步 提取 时 空 特征 ， 通 过 
Softmax 实现 猪 的 饮水 行为 检测 。Guo 等 ”和 Qiao 
等 ”分别 构建 了 基于 BiGRU-attention 和 C3D-Con- 
vLSTM 的 奶牛 典型 行为 识别 模型 ， 在 提取 奶牛 行 
为 视频 段 的 时 序 特 征 基 础 上 对 奶牛 的 行走 、 站 立 、 
梳理 、 探 索 以 及 采 食 行为 进行 了 识别 ， 并 在 不 同 生 
长 阶段 的 奶牛 数据 集 上 进行 了 验证 ,试验 结果 表 
明 ，BiGRU-attention 和 C3D-ConvLSTM 识别 准确 
率 分 别 约 为 82% 和 95.5%。Jiang 等 "采用 单 流光 
流 卷 积 网 络 ， 对 奶牛 跨行 行为 进行 了 检测 ， 准 确 率 
为 98.24%。Wu 等 ”采用 CNN-LSTM 网 络 模型 , 
对 奶牛 的 饮水 、 反 刍 、 行 走 、 站 立 和 休息 5 种 行为 
进行 了 识别 ， 首 先 通过 CNN 网 络 获取 图 像 的 视觉 
特征 ， 再 通过 LSTM 来 获取 时 空 特征 ， 其 结果 优 于 
其 他 基于 视觉 特征 或 者 空间 特征 的 深度 学 习 模型 。 

上 述 深度 学 习 提 取 行 为 识别 时 空 特征 的 研究 结 
果 表 明 ， 大 部 分 研究 是 通过 将 CNN 模型 与 LSTM 
模型 结合 提取 数据 的 时 空 特征 ， 以 此 提升 行为 识别 
模型 的 性 能 。 然 而 ,在 目前 的 研究 中 仍然 存在 相似 
性 行为 (如 饮水 和 游戏 ) 识别 错误 的 现象 。 因 此 ， 
基于 时 空 特征 的 行为 识别 研究 仍 需 要 进一步 研究 。 
4.3 行为 量化 分 析 

当前 对 动物 行为 的 研究 缺乏 定量 分 析 CEU 
率 、 和 运动 时长、 反刍 时 长 等 )， 而 分 析 动 物 与 其 周 
围 环境 的 语义 关系 场景 图 ， 对 家 畜 站 立 、 进 食 、 行 
走 及 把 跨 等 不 同行 为 在 时 空域 下 进行 统计 和 量化 分 
析 ， 构 建行 为 图 谱 ， 可 为 动物 异常 行为 判断 以 及 精 
准 养殖 管理 提供 科学 依据 。 在 检测 动物 行为 的 基础 
上 ， 进 一 步 对 行为 的 时 长 、 幅 度 等 进行 量化 研究 有 
利于 提高 对 动物 畜牧 场 的 管理 效率 ， 提 高 效益 ， 比 
如 影响 动物 的 采 食 、 饮 水 或 休息 行为 的 外 界 因素 等 
的 研究 ， 有 利于 对 动物 活动 规律 的 认 知 ， 改 善 管理 
决策 。 目 前 主要 通过 改变 饲料 、 光 照 、 温 度 、 垫 料 
等 因素 定性 分 析 对 动物 行为 的 影响 ” ， 以 此 为 动 
物 提供 舒适 场所 提高 动物 福利 。 然 而 ， 大 多 数 研 究 
主要 通过 人 工 观察 记录 动物 的 行为 变化 情况 9. 

随 着 计算 机 视觉 技术 的 发 展 ， 该 技术 也 被 用 于 


评估 动物 行为 与 环境 间 的 相关 性 研究 中 。Guo 等 IU 
采用 背景 减法 和 帧 间 差 的 集成 方法 对 犊 牛 与 场景 的 
交互 行为 进行 了 检测 ， 实 现 特 牛 采 食 、 饮 水 和 休息 
行为 等 与 场景 交互 行为 的 识别 。 试 验 结果 表明 ， 该 
方法 对 于 牛 进入 牛 栏 、 离 开 牛 栏 、 保 持 静 止 〈 站 和 
躺 等 静态 行为 ) 和 转身 的 环境 交互 行为 识别 的 准确 
率 分 别 为 94.38%、92.86%、96.85% 和 93.51%. 
Costa 等 通过 图 像 分 析 技 术 探 索 猪 的 活动 与 猪 含 
内 环境 参数 (通风 率 、 温 度 和 湿度 ) 之 间 的 关系 ， 
旨 在 研究 环境 对 猪 生 长 的 影响 。Chen 等 ”在 
CNN-LSTM 检测 猪 的 目标 区 域 的 基础 上 ， 提 出 了 
— PREF RAMA. HSV 颜色 空间 变换 和 模板 匹 
配 的 图 像 处 理 算 法 ， 计 算 猪 头 部 的 圆 度 、 头 部 进 采 
食 区 域 的 比例 、 头 部 运动 的 累积 像素 ， 以 及 头 部 到 
猪 背 上 数字 标签 的 距离 ， 以 确定 每 头 猪 的 身份 和 喂 
食 时 间 ， 识 别 猪 喂养 行为 的 准确 率 为 95.9%。 

如 上 研究 ， 计 算 机 视觉 技术 在 评估 动物 行为 与 
环境 间 的 相关 性 方面 取得 了 较 好 的 成 果 。 然 而 ,在 
识别 动物 与 环境 交互 的 行为 中 仍然 存在 许多 难以 识 
别 和 识别 错误 的 问题 。 例 如 ， 小 牛头 部 在 进食 前 后 
在 喂养 盆 中 静止 不 动 ， 或 者 小 牛头 部 的 阴影 被 错误 
地 识别 为 喂养 行为 。 且 深度 学 习 技 术 在 该 方面 的 应 
用 较 少 ， 仍 需 结 合 实际 需求 进一步 探索 。 


4.4 小 结 


深度 学 习 方法 用 于 动物 行为 识别 面临 着 两 个 主 
要 挑战 。 首 先 ， 深 度 学 习 模 型 的 训练 需要 大 数据 
集 ， 而 基于 深度 学 习 的 识别 方法 在 推广 到 新 的 数据 
集 或 其 他 类 型 的 动物 时 往往 存在 局 限 性 。 男 外 ， 现 
有 的 动物 行为 识别 缺少 时 间 维 度 、 空 间 场 景 信息 及 
动物 与 环境 交互 活动 的 分 析 ， 难 以 实现 高 级 复杂 行 
为 的 语义 理解 和 分 析 ， 需 建立 动物 时 空 场景 行为 识 
别 与 理解 的 新 理论 方法 。 目 前 采用 深度 学 习 拉 术 在 
检测 和 识别 动物 行为 的 基础 上 ， 进 一 步 挖掘 行为 时 
长 或 频次 信息 的 研究 仍 比较 缺乏 ， 需 要 进一步 探 
索 。 此 外 ， 微 小 行为 的 检测 和 识别 也 面临 着 一 些 挑 
战 ， 例 如 复杂 的 场景 、 可 变 光照 、 谈 挡 、 牲 冀 之 间 
的 接触 和 重合 ， 而 深度 学 习 技术 结合 注意 力 机 制 模 
块 已 被 证 明 在 一 定 程度 上 解决 了 局 部 细节 的 辨识 问 
题 ， 并 被 用 于 识别 牲畜 行为 ， 但 无 法 记录 环境 变 


60 


ChinaXiv 合 作 期 刊 


202305.00209v1 


chinaXiv 


量 ， 仍 需 与 传感器 相 结合 构建 一 套 完整 的 监测 系 
统 。 环 境 参数 的 调控 有 利于 为 动物 提供 舒适 场所 ， 
提高 动物 健康 福利 ， 故 对 环境 参数 与 行为 的 量化 关 
系 研究 具有 重大 意义 。 
5 挑战 与 展望 

规模 化 、 标 准 化 、 智 能 精准 化 健康 养殖 与 管理 
是 畜牧 养殖 大 势 所 趋 。 近 年 来 虽然 规模 化 、 标 准 化 
养殖 快速 提升 ， 但 中 国 大 多 数 牛 场 智能 精细 化 管理 
水 平 仍 处 于 初级 阶段 ， 整 体 信息 化 、 自 动 化 程度 不 
高 。 深 度 学 习 技术 与 畜牧 业 相 结合 ， 能 够 加 强 畜牧 
养殖 过 程 中 远程 信息 感知 能 力 ， 获 取 动物 生长 状况 
和 养殖 环境 信息 ， 实 时 监测 动物 健康 情况 ， 从 而 对 
动物 进行 精准 化 管理 。 畜 牧 业 养殖 涉及 环境 监测 、 
设施 布局 、 信 息 采集 和 传输 ， 营 养 供给 ， 以 及 动物 
生理 和 心理 变化 的 感知 等 ， 深 度 学 习 模型 已 向 轻 量 
化 结构 发 展 ， 在 占用 较 少 的 存储 空间 的 同时 ， 实 现 
高 效 高 精度 的 信息 处 理 。 目 前 相关 研究 中 ， 深 度 学 
习 技 术 已 被 用 于 动物 目标 检测 、 个 体 识别 、 体 况 评 
价 、 体 重 估计 、 行 为 检测 等 任务 中 。 然 而 ， 深 度 学 
习 在 模型 轻 量 化 、 泛 化 性 以 及 与 机 械 装备 、 机 器 人 
等 智能 装备 相 结 合 等 方面 仍 需 进 一 步 发 展 ， 以 满足 
实际 饲养 和 管理 需求 ， 具 体 主要 面临 的 挑战 如 下 : 

(1) 深度 学 习 模 型 往往 依赖 大 量 带 有 标记 的 数 
据 样本 ， 在 推广 到 新 的 数据 集 或 其 他 类 型 的 动物 时 
往往 存在 局 限 性 ， 且 在 复杂 的 饲养 环境 下 ， 对 家 畜 
图 像 和 视频 数据 的 标记 费时 耗 力 (如 对 动物 体 况 评 
分 以 及 微小 行为 变化 标记 等 )。 如 何 结合 半 监 督 或 
者 少 样本 学 习 来 提高 深度 学 习 模型 的 泛 化 能 力 ， 实 
现 对 家 畜生 理 生 境 的 感知 和 分 析 ， 构 建 实时 全 天 候 
的 智能 监测 和 分 析 系 统 仍 有 挑战 性 。 目 前 常 采 用 图 
像 增 强 的 方法 进行 风格 迁移 、 图 像 生成 来 实现 样本 
扩充 ， 但 与 真实 饲养 环境 仍 有 差异 。 此 外 ， 基 于 少 
样本 的 研究 是 否 可 应 用 到 畜牧 养殖 中 仍 需 进一步 
探索 。 

(2) 人 、 装 备 和 养殖 动物 这 三 者 的 统一 协作 及 
和 谐 发 展 。 智 能 装备 应 用 于 畜牧 业 中 ， 可 以 提高 生 
产 效率 ， 解 放 劳动 力 ， 但 在 保障 动物 福利 同时 便于 
畜牧 养殖 人 员 操 作 管理 仍 需 不 断 进行 理论 与 实践 的 
探索 ， 才 能 最 终 从 整体 上 提高 养殖 效率 和 管理 水 


平 。 其 中 ,智能 装备 用 于 畜牧 生产 ， 根 据 不 同 的 需 
求 ， 智 能 装备 存在 多 样 性 ， 智 能 装备 精细 化 作业 也 
是 智慧 畜牧 面临 的 挑战 之 一 。 

3) 大 数据 、 深 度 学 习 技 术 与 畜牧 养殖 的 次 度 
融合 。 随 着 深度 学 习 、 物 联网 、 传 感 器 技术 的 发 
展 ， 获取 动物 信息 数据 的 数量 和 质量 都 有 较 大 的 提 
高 。 制 定 统一 、 高 效 的 畜牧 行业 数据 标准 ， 增 强 数 
据 的 安全 性 和 可 维护 性 ， 结 合 深度 学 习 和 智能 计算 
对 大 数据 进行 数据 分 析 和 处 理 ， 并 将 智能 化 技术 应 
用 到 疾病 防 控 、 精 准 饲 喂 、 环 境 控制 以 及 良品 选 育 
等 重大 核心 问题 KRE fr HOME BS A TRUE ECKE 
动作 用 。 而 数据 采集 设备 的 布局 、 数 据 的 实时 传输 
通信 、 算 法 高 效 精准 的 性 能 以 及 监测 结果 如 何 与 动 
物 健康 信息 关联 具有 挑战 性 。 

(4) 以 深度 学 习 模 型 为 代表 的 人 工 智 能 技术 在 
养殖 领域 面临 的 可 解释 性 和 安全 性 挑战 。 可 解释 性 
是 指 模 型 从 数据 中 学 到 了 哪些 知识 (以 人 类 可 以 理 
解 的 方式 表达 的 ) 从 而 产生 了 最 终 的 决策 ， 以 及 基 
于 哪些 因素 进行 的 判断 和 如 何 进行 最 终 决 策 。 然 而 
这 种 “ 端 到 端 ” 的 决策 模式 导致 深度 学 习 模 型 的 解 
释 性 极 弱 。 这 也 是 为 什么 在 深度 学 习 准 确 率 这 么 高 
的 情况 下 ,仍然 有 一 大 部 分 人 倾向 于 应 用 可 解释 性 
高 的 传统 统计 学 模型 的 原因 。 安 全 性 方面 是 指 以 深 
度 神 经 网 络 为 代表 的 人 工 智 能 技术 由 于 其 算法 复 
杂 ， 参 数 众多 ， 需 海量 数据 驱动 等 特性 使 得 其 自身 
具有 众多 安全 缺陷 。 随 着 智 意 畜牧 的 发 展 ， 人 工 智 
能 技术 的 广泛 推广 ， 其 与 养殖 产业 管理 与 经 济 密 切 
相关 ， 而 这 些 安 全 隐患 很 可 能 在 某 个 节点 彻底 爆 
发 。 所 以 ， 对 人 工 智 能 技术 的 安全 性 研究 变 得 尤为 
重要 。 

综 上 ， 深 度 学 习 技 术 已 逐渐 被 应 用 到 家 畜 上 自动 
识别 和 健康 监测 等 任务 ， 但 实现 实时 监测 以 及 多 场 
景 下 的 应 用 仍 需 进一步 优化 监测 模型 。 另 外 ,许多 
实际 应 用 环境 下 的 挑战 仍 需 不 断 克 服 ， 比 如 不 同 生 
长 阶段 、 不 同 动物 品种 下 模型 的 泛 化 性 能 和 重 棒 性 
等 。 为 了 促进 畜牧 业 的 发 展 ， 必 将 结合 畜牧 实际 的 
人 饲养 模式 、 空 间 布局 、 管 理 模式 、 生 产 预 期 等 ， 从 
实际 情况 出 发 开发 构建 智能 化 监测 系统 ， 才 能 推动 
畜牧 业 的 发 展 。 
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Abstract: Accurate and efficient monitoring of animal information, timely analysis of animal physiological and physical health condi- 
tions, and automatic feeding and farming management combined with intelligent technologies are of great significance for large-scale 
livestock farming. Deep learning techniques, with automatic feature extraction and powerful image representation capabilities, solve 
many visual challenges, and are more suitable for application in monitoring animal information in complex livestock farming environ- 
ments. In order to further analyze the research and application of artificial intelligence technology in intelligent animal farming, this 
paper presents the current state of research on deep learning techniques for tag detection recognition, body condition evaluation and 
weight estimation, and behavior recognition and quantitative analysis for cattle, sheep and pigs. Among them, target detection and rec- 
ognition is conducive to the construction of electronic archives of individual animals, on which basis the body condition and weight in- 
formation, behavior information and health status of animals can be related, which is also the trend of intelligent animal farming. At 
present, intelligent animal farming still faces many problems and challenges, such as the existence of multiple perspectives, multi- 
scale, multiple scenarios and even small sample size of a certain behavior in data samples, which greatly increases the detection diffi- 
culty and the generalization of intelligent technology application. In addition, animal breeding and animal habits are a long-term pro- 
cess. How to accurately monitor the animal health information in real time and effectively feed it back to the producer is also a techni- 
cal difficulty. According to the actual feeding and management needs of animal farming, the development of intelligent animal farm- 
ing is prospected and put forward. First, enrich the samples and build a multi perspective dataset, and combine semi supervised or 
small sample learning methods to improve the generalization ability of in-depth learning models, so as to realize the perception and 
analysis of the animal's physical environment. Secondly, the unified cooperation and harmonious development of human, intelligent 
equipment and breeding animals will improve the breeding efficiency and management level as a whole. Third, the deep integration 
of big data, deep learning technology and animal farming will greatly promote the development of intelligent animal farming. Last, 
research on the interpretability and security of artificial intelligence technology represented by deep learning model in the breeding 
field. And other development suggestions to further promote intelligent animal farming. Aiming at the progress of research applica- 
tion of deep learning in livestock smart farming, it provides reference for the modernization and intelligent development of livestock 
farming. 
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